单细胞转录组高级分析介绍
在第一篇单细胞转录组(Single cell RNA)概述里,我们介绍的是单细胞转录组基本知识及研究概况。
基于此,在上一篇单细胞转录组亚群分析里,则详细讲述了细胞亚群的鉴定、亚群之间的差异以及发育轨迹分析等诸多分析策略。
这一篇中,我们将介绍一些单细胞转录组相关的高级分析~
细胞通讯分析即受体配体分析,目前能进行的分析主要是基于CellPhoneDB数据库进行受体配体匹配分析,根据每个细胞亚群中受体配体的表达,研究亚群之间的细胞通讯关系,从而为研究细胞亚群的功能、发育轨迹、细胞亚群的相关性提供线索。
CellPhoneDB:https://www.cellphonedb.org/
目前该数据主要是提供的人的相应数据,其他物种的数据库基本上是根据同源基因来进行匹配的。
做细胞通讯分析一个比较简单实用的工具-iTALK。其结果如上图所示,左图展示了不同亚群之间的相关性,右图展示了亚群中某个关系较近的基因具体与其他亚群的关系。
iTALK:https://github.com/Coolgenome/iTALK
转录因子分析有两种方式,一种是根据已有的数据库,对所有的差异基因或者marker基因进行转录因子注释,得到相应的结果,看看是否有相关的转录因子。
另外一种方式是通过SCENIC工具进行转录因子数据分析。SCENIC首先会计算基因的共表达,分成不同的模块,根据转录因子及其靶基因,把转录因子及其靶基因作为一个整体的模块,来计算该基因集在所有细胞或者亚群中的得分,得到转录调控的关键转录因子及其关键基因。
目前SCENIC主要支持物种有人、小鼠、果蝇。这个工具还与seurat具有较好的兼容性,可以在seurat聚类图中展示关键转录因子。
RNA velocyto是发育轨迹分析的一种方法。它的输入文件为bam文件,通过bam文件,计算每个细胞或者基因的剪切表达数目与未剪切的表达数目,来计算RNA 速率。RNA 速率具有方向性,因此得到的结果对发育估计也提供了一种较好的提示。其结果如下图所示:
10xGenomics公司提供了一种将转录组与VDJ联合分析的平台,我们可以对同一个细胞,同时获得其转录组数据和VDJ数据,从而进一步深入研究其免疫特征。
上图的聚类和基因表达热图是基于表达量数据进行分析的聚类结果,VDJ分布图展示了具有VDJ的细胞在转录组表达上分布在哪个亚群。clonetype图展示了某个特定克隆型在表达数据上的分布。
VDJ结果可以反映细胞亚群的相似性,如果两个亚群的VDJ表型一致,那么两个亚群的相似性越高。
如上图所示,可以将单细胞转录组与单细胞ATAC数据联合分析,进行降维聚类,更进一步研究转录调控的关键问题,解析不同细胞类型及关键的分子特征和调控。
由于单细胞数据较大,细胞数目较多,因此普通单细胞转录组的共表达分析不太适合单细胞转录组数据。比如WGCNA是不太适合10xGenomics单细胞转录组数据进行普通调控分析(如果挑选部分基因另说)。
目前单细胞转录组关于基因调控网络分析的工具也较多,大部分分析工具的输入文件除了需要表达矩阵以外,还需要输入细胞发育轨迹的拟时间值辅助进行调控网络分析。下图为调控网络分析的一个示范。
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1713-4
说到批次矫正,这是转录调控研究中最重要的一个问题,不管是单细胞转录组还是Bulk RNA 都存在这个问题。
目前单细胞转录组的批次矫正的工具有很多种,比如Conos、LIGER、 fastMNN、Harmony、
ALRA以及seurat的CCA。
各工具链接如下:
Conos:https://github.com/hms-dbmi/conos
LIGER:https://github.com/MacoskoLab/liger
fastMNN:https://bioconductor.org/packages/release/bioc/html/scran.html
Harmony:https://github.com/immunogenomics/harmony
ALRA:https://github.com/KlugerLab/ALRA)
CCA:https://satijalab.org/seurat/v3.1/integration.html
不同的方法有自己的优势,目前应用最广的是CCA批次矫正,上述工具基本上都与seurat工具无缝对接。在这里就不一一进行介绍了。
单细胞转录组分析的相关内容,此次就介绍到这里。这是自己对单细胞的一些理解,有不完善的地方,主要是对单细胞转录组进行了一个整体的概述。
具体每个分析如何进行并未详述,大家如果有感兴趣的,可以自己查阅一下,或者大家在后台留言,然后根据大家的留言进行后续更新。
1.Giovanni Iacono, Ramon Massoni-Badosa, Holger Heyn. Single-cell transcriptomics unveils gene regulatory network plasticity[J]. Genome biology, 2019, 20(1).
2.Gioele L M , Ruslan S , Amit Z , et al. RNA velocity of single cells[J]. Nature, 2018.
3.Park J , Shrestha R , Qiu C , et al. Single-cell transcriptomics of the mouse kidney reveals potential cellular targets of kidney disease[J]. Science, 2018:eaar2131.
4.Zhang X, Lan Y, Xu J, et al. CellMarker: a manually curated resource of cell markers in human and mouse[J]. Nucleic Acids Research, 2019.
5.Aran D, Looney A P, Liu L, et al. Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage[J]. Nature Immunology, 2019, 20(2): 163-172.
6.Aibar S , González-Blas, Carmen Bravo, Moerman T , et al. SCENIC: single-cell regulatory network inference and clustering[J]. Nature Methods, 2017.
7.Wouter, Saelens, Robrecht, et al. A comparison of single-cell trajectory inference methods[J]. Nature Biotechnology, 2019.
8.F, Alexander, Wolf, et al. PAGA: graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells.[J]. Genome biology, 2019.
9.Diether L , Els W , Bram B , et al. Phenotype molding of stromal cells in the lung tumor microenvironment[J]. Nature Medicine, 2018.
10.Zheng C , Zheng L , Yoo J K , et al. Landscape of Infiltrating T Cells in Liver Cancer Revealed by Single-Cell Sequencing[J]. Cell, 2017, 169(7):1342-1356.e16.
作者:尧小飞
审稿:童蒙
编辑:angelica
往 期 精 彩